분포수 세기 알고리즘을 정리하면 다음과 같다.
1. count[WEBSTUDY:] 배열을 0으로 초기화
2. a[] 배열의 키 빈도를 계산하여 count[WEBSTUDY:]에 저장
3. count[] 배열을 누적분포로 변환
4. a[] 배열을 뒤에서부터 읽어서 b[--count[a[WEBSTUDY:i]]]에 저장
5. b[] 배열을 a[]에 복사

분포수 세기의 실제

분포수세기 알고리즘은 안정성(statbility)에 있다. 그래서 a[] 배열에서 값을 꺼내올 때 뒤에서부터 꺼낸다.
그림 참조

Java로 구현한 분포수세기


package com.oracleclub.study.algorithm;

import org.junit.Test;

public class DistributionCountingTest {

	@Test
	public void distributionCounting_test() {
		int[] a = {1, 3, 4, 2, 3};
		int[] b = distributionCounting(a, 5, 4);
		for (int i = 0; i < b.length; i++) {
			System.out.println("b[" + i + "]=" + b[i]);
		}
	}
	
	/**
	 * 
	 * @param a
	 * @param n 입력인자 a[] 배열이 가지는 개수
	 * @param m a[] 배열이 가지는 키 값의 범위
	 */
	private int[] distributionCounting(int a[], int n, int m) {
		int[] b = new int[n];			// 정렬 결과를 담을 변수
		int[] count = new int[m + 1];	//1. count[] 배열 선언 및 초기화
		
		
		// 2. 배열 a[]에서 키의 빈도수를 계산하여 count[]에 저장
		for (int i = 0; i < n; i++) {
			++count[a[i]];
		}
		
		// 3. count[] 배열을 누적분포로 변환
		for (int i = 1; i <= m; i++) {
			count[i] += count[i-1];
		}
		
		// 4. a[] 배열을 뒤에서부터 읽어서 배열 b[--count[a[i]]]에 저장
		for (int i = n - 1; i >= 0; i--) {
			b[--count[a[i]]] = a[i];
		}
		
		return b;
	}	
}

분포수세기의 분석

약 2N번의 비교와 1번의 전체 복사가 있는 정도여서 속도는 빠르다.
하지만, 입력자료의 범위가 아주 넓을 때는 메모리 소모가 너무 커서 아주 느린 성능을 보인다.

작은 범위의 키 값을 가지는 경우에 사용한다.(키 값은 이산적이어야 한다.연속된 형태가 아니어야 한다는 말이다)
중복된 키가 많은 경우 적합하다.

분포수 세기 알고리즘은 기수 정렬에서 사용되어 강력한 기능을 발휘하므로 눈여겨 볼 필요가 있다.

문서에 대하여

이 문서의 내용은 C로 배우는 알고리즘 (1) 교재를 스터디 하면서 정리한 내용 입니다.
최초작성자 : 유진우
최초작성일 : 2009년 3월 15일
이 문서는 오라클클럽 자바 웹개발자 스터디 모임에서 작성하였습니다.
이 문서를 다른 블로그나 홈페이지에 퍼가실 경우에는 출처를 꼭 밝혀 주시면 고맙겠습니다.~^^

5.6 분포수세기(Distribution Counting) (by sily20) [2009.05.04]

목차

개요

분포수 세기

분포수 세기의 전략

분포수 세기의 실제

Java로 구현한 분포수세기

분포수세기의 분석

문서에 대하여